مقدمه
سیستم رتبهبندی ClusterMAX™ و محتوای این مقاله بهطور مستقل توسط SemiAnalysis تهیه شده است. هیچ بخشی از پاداش SemiAnalysis توسط مشتریان ما، بهطور مستقیم یا غیرمستقیم به رتبهبندیها، امتیازات یا نظرات خاص بیانشده مرتبط نبوده، نیست و نخواهد بود.
شور و هیجان در بازار اجاره واحد پردازش گرافیکی (GPU) فروکش کرده است. ما این موضوع را در گزارش اقتصاد ابر GPU در دسامبر ۲۰۲۳ پیشبینی کردیم و این دیدگاه را در گزارش آناتومی و راهنمای نئوکلاد هوش مصنوعی (AI Neocloud) که در اکتبر ۲۰۲۴ منتشر شد، تکرار کردیم. بهبودهای فناورانه به این معنی است که هزینه محاسبات به مرور زمان کاهش مییابد و اکنون معتقدیم که بازار به نفع خریداران GPUهای اجارهای است، بهویژه برای کلاس Hopper و کلاس MI300. دسترسی گستردهای از بیش از ۱۰۰ نئوکلاد هوش مصنوعی و ابرمقیاسپذیر (Hyperscaler) وجود دارد.
بخشی از این امر به دلیل ورود بازیگران جدید و گزینههای بیشتر برای اجاره است. در حال حاضر، هیچ «راهنمای چگونگی» برای اجاره GPU یا ارزیابی مستقلی از ابرهای GPU تا به امروز وجود نداشته است.
در ۱۲ ماه گذشته، ما زمان صرف ایجاد سیستم رتبهبندی ClusterMAX™ ابر GPU، یا به اختصار ClusterMAX™ کردهایم. ما بهطور مستقل تا حد امکان ابرهای GPU را آزمایش کرده و/یا بازخورد مشتریان را جمعآوری کردهایم. ما معتقدیم که با این اولین رتبهبندی ابر GPU، ۹۰٪ از بازار اجاره GPU را بر اساس حجم GPU پوشش خواهیم داد. امیدواریم در تمرین رتبهبندی بعدی خود، ارائهدهندگان بیشتری را شامل شویم تا بتوانیم کیفیت آنها را ارزیابی کنیم.
این لیست جامعی از ارائهدهندگان GPU نیست. ما لیست بسیار گستردهتری از بازیگرانی که از آنها آگاه هستیم داریم و کل نقشه بازار در تصویر زیر نشان داده شده است. به نظر میرسد این لیست روزانه در حال گسترش است، اما بسیاری از نئوکلادها هنوز برای مشتریان آماده نیستند. این هدف ClusterMAX™ است، زیرا ابزاری ساده برای کمک به شما در پیمایش پیچیدگی است. احتمالاً ارزش دارد که پول خود را صرف یک ارائهدهنده دارای رتبه ClusterMAX™ کنید.
طبقهبندیهای رتبهبندی ما عبارتند از: پلاتینیوم (Platinum)، طلا (Gold)، نقره (Silver)، برنز (Bronze) و عملکرد ضعیف (UnderPerform). در ادامه این گزارش، هر رتبه را با جزئیات بیشتری توضیح خواهیم داد.
علاوه بر این، ما همچنین در مورد بازار اجاره H100، مسیر آینده آن، قیمتگذاری ابرمقیاسپذیرها در مقابل نئوکلادها، هزینه کل مالکیت (TCO) در سطح خوشه، بازده خوشه و تحلیل سناریو، بحثهای مختلف پیرامون تقاضا، و اعمال این چارچوب/تحلیل بر روی CoreWeave و عرضه اولیه عمومی (IPO) آن بحث خواهیم کرد.
خلاصه اجرایی
- SemiAnalysis اولین سیستم رتبهبندی ابر GPU جهان را توسعه داده است – ما این سیستم را ClusterMAX™ نامیدهایم. ما به رتبهبندی GPUها از دیدگاه یک مشتری متوسط و منطقی نگاه میکنیم.
- SemiAnalysis بهطور مستقل دهها GPU را آزمایش کرده است و ClusterMAX™ در حال حاضر تقریباً ۹۰٪ از کل بازار GPU را بر اساس حجم GPU پوشش میدهد.
- استاندارد در سراسر صنعت ابر GPU در حال حاضر بسیار پایین است. هدف ClusterMAX™ ارائه مجموعهای از دستورالعملها برای کمک به بالا بردن استاندارد در کل صنعت ابر GPU است. دستورالعملهای ClusterMAX™ ویژگیهایی را ارزیابی میکنند که اکثر اجارهکنندگان GPU به آنها اهمیت میدهند.
- ClusterMAX™ دارای پنج سطح مختلف است: پلاتینیوم، طلا، نقره، برنز و عملکرد ضعیف.
- ما تمرینات رتبهبندی و ارزیابی ClusterMAX™ را بهطور منظم هر ۳-۶ ماه یکبار انجام خواهیم داد تا بهبودهای GPUهای مختلف منعکس شود و مشتریان بتوانند آخرین اطلاعات در مورد GPUها را داشته باشند.
- ClusterMAX™ Platinum نشاندهنده ابرهای GPU است که استاندارد صنعت را بالا میبرند و تنها یک ابر GPU، یعنی CoreWeave، وجود دارد که خدماتی در این سطح ارائه میدهد.
- CoreWeave در حال حاضر تنها شرکت غیر ابرمقیاسپذیر است که در بهرهبرداری قابل اعتماد از خوشههای H100 در مقیاس بزرگ (بیش از ۱۰ هزار) تجربه دارد.
- برخی از ارائهدهندگان در دسته ClusterMAX™ Bronze، مانند Google Cloud، در حال حاضر تلاش قابل توجهی برای رسیدن به سطح بالاتر انجام میدهند. ما معتقدیم Google Cloud در مسیر سریعی به سمت ClusterMAX™ Gold یا ClusterMAX™ Platinum تا زمان ارزیابی مجدد بعدی ما قرار دارد.
- شرکتهای بزرگ عمدتاً GPUها را از ابرمقیاسپذیرها + CoreWeave اجاره میکنند. شرکتهای بزرگ به ندرت از نئوکلادهای نوظهور اجاره میکنند.
- قیمت اجاره GPU ابرمقیاسپذیرها بالاتر از غولهای نئوکلاد و نئوکلادهای نوظهور است زیرا ابرمقیاسپذیرها عمدتاً به بازار سازمانی خدمت میکنند.
- Oracle با یکی از پایینترین قیمتهای اجاره GPU در میان ابرمقیاسپذیرها عرضه میشود.
- در میان ابرهای GPU که از نظر فنی بسیار توانمند هستند، Nebius کمترین قیمت مطلق و بهترین شرایط را برای اجارههای کوتاه تا میانمدت ارائه میدهد. Crusoe نیز علاوه بر شایستگی فنی قوی، قیمتگذاری و شرایط قرارداد معقولی را ارائه میدهد.
- همانطور که اولین بار در مقاله ما در مورد اقتصاد ابر GPU که در دسامبر ۲۰۲۳ منتشر شد بحث کردیم، بهبودهای فناورانه به این معنی است که هزینه محاسبات به مرور زمان کاهش مییابد و اکنون معتقدیم که بازار به نفع خریداران GPUهای اجارهای است. ۱۰۰ ابر GPU وجود دارد که همگی برای عمدتاً همان مشتریان رقابت میکنند.
- راهاندازی DeepSeek باعث تثبیت کوتاهمدت و حتی افزایش قیمت اجاره H200 شد، اما در میانمدت تا بلندمدت، قیمتها همچنان در حال کاهش هستند.
- جنسن هوانگ، مدیر عامل انویدیا و به تعبیری "نابودگر ارشد درآمد"، هفته گذشته گفت: «وقتی Blackwellها به حجم انبوه شروع به عرضه کنند، حتی نمیتوانید Hopperها را رایگان بدهید.» از دیدگاه اپراتور GPU، این باید هشداری برای ارائهدهندگان اجاره GPU باشد تا اطمینان حاصل کنند که قراردادهایی را منعقد میکنند که آنها را از کاهش سریع قیمت محاسبات محافظت میکند – یعنی تا حد امکان قراردادهای بلندمدت امضا کنند. از دیدگاه مشتری، آنها ممکن است انعطافپذیری در تعهدات خود را ترجیح دهند و قراردادهای کوتاهمدت را انتخاب کنند.
- در پایان مقاله بیشتر در مورد قیمتگذاری اجاره GPU و نرخ بازده داخلی (IRR) GPUها و همچنین نرخهای اخیر بازار اجاره GPU برای طولهای مختلف قرارداد صحبت خواهیم کرد. اگر خوانندهای هستید که عمدتاً به جنبه مالی GPUها
ClusterMAX™ – سیستم رتبهبندی برای ابرهای GPU
ClusterMAX™ اولین سیستم رتبهبندی ابر GPU مستقل در جهان است. ما دهها ابر GPU را آزمایش کردهایم و با صدها مشتری این ابرها صحبت کردهایم تا این سیستم رتبهبندی را ایجاد کنیم. ClusterMAX™ بر اساس بازخورد و تجربه دست اول توسعه یافته است. این یک چارچوب مبتنی بر تجربه و تخصص گسترده ما در صنعت است. سیستم رتبهبندی ClusterMAX™ بهطور مستقل توسط SemiAnalysis توسعه یافته است. ما بازخورد مشتریان را دریافت میکنیم و در برخی موارد، خودمان از GPUهای ابری استفاده کردهایم. در حالی که ما روابط تجاری با بسیاری از ارائهدهندگان GPU داریم، هیچ بخشی از پاداش SemiAnalysis بهطور مستقیم یا غیرمستقیم به رتبهبندیها، امتیازات یا نظرات خاص بیانشده در این گزارش مرتبط نیست.
ما معتقدیم که استاندارد فعلی برای ابرهای GPU بسیار پایین است. بسیاری از ارائهدهندگان ابر GPU وجود دارند که به سادگی GPUهای خود را به مشتریان اجاره میدهند و کمترین تلاش را برای ارائه یک تجربه مشتری با کیفیت بالا انجام میدهند. هدف ClusterMAX™ ارائه مجموعهای از دستورالعملها برای کمک به بالا بردن استاندارد برای کل صنعت ابر GPU است. ClusterMAX™ پنج سطح دارد: پلاتینیوم، طلا، نقره، برنز و عملکرد ضعیف.
ما معتقدیم که معیارهای ارزیابی که استفاده کردهایم، آنچه را که مشتریان متوسط ابر GPU به دنبال آن هستند، منعکس میکند:
- شبکه (Networking): تأخیر و پهنای باند شبکه اتصال داخلی (Interconnect) برای اکثر مشتریان، به ویژه آنهایی که به خوشههای بزرگ برای آموزش نیاز دارند، اهمیت دارد. ما شبکه را با استفاده از تستهای NCCL و همچنین اجرای بارهای کاری واقعی ارزیابی میکنیم.
- پشته نرمافزار / API: سهولت استفاده و گستردگی عملکرد پشته نرمافزار / API مهم است. ما ارزیابی میکنیم که راهاندازی یک خوشه GPU با استفاده از پشته نرمافزار / API چقدر آسان است.
- زمان کارکرد / پایداری: زمان کارکرد، پایداری و توافقنامه سطح خدمات (SLA) برای اکثر مشتریان حیاتی است. ما این را بر اساس آزمایش و بازخورد مشتریان ارزیابی میکنیم.
- پشتیبانی مشتری: در دسترس بودن و کیفیت پشتیبانی مشتری در صورتی که چیزی اشتباه شود، مهم است.
- مقیاسپذیری: توانایی مقیاسپذیری سریع در هنگام نیاز مشتریان مهم است.
- قیمتگذاری: قیمتگذاری، به ویژه قیمت در مقابل عملکرد، مهم است.
- امنیت و انطباق: اقدامات امنیتی و گواهینامههای انطباق (مانند SOC2، HIPAA) برای برخی مشتریان مهم است.
برای اینکه یک ارائهدهنده ابر GPU بتواند در یک رده خاص قرار گیرد، باید تمام معیارهای آن رده را برآورده کند. به عنوان مثال، برای دریافت رتبه ClusterMAX™ Platinum، یک ارائهدهنده ابر GPU باید در تمام معیارهای Platinum برتر باشد. اگر در هر یک از معیارها کوتاهی کند، به رده پایینتر منتقل میشود.
این امر منجر به برخی موقعیتهای جالب میشود که در آن ارائهدهندگان ابر GPU که در اکثر معیارها قوی هستند، اما در یک یا دو معیار کلیدی ضعیف عمل میکنند، رتبه پایینتری نسبت به آنچه انتظار میرود دریافت میکنند. به عنوان مثال، Microsoft Azure و Google Cloud هر دو دارای نقاط قوت قابل توجهی هستند، اما به دلیل مشکلاتشان در معیار زمان کارکرد / پایداری، به ترتیب به ClusterMAX™ Gold و ClusterMAX™ Bronze تنزل یافتهاند.
ما در نظر داریم تمرینات رتبهبندی ClusterMAX™ را هر ۳-۶ ماه یکبار انجام دهیم. این به ما امکان میدهد تا پیشرفت ارائهدهندگان مختلف GPU را منعکس کنیم و به مشتریان آخرین اطلاعات در مورد ابرهای GPU را ارائه دهیم. ما معتقدیم که این امر ارائهدهندگان ابر GPU را تشویق میکند تا به بهبود خدمات خود ادامه دهند.
ClusterMAX™ Platinum
ClusterMAX™ Platinum بالاترین رتبه در سیستم رتبهبندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا میشود که در تمام معیارها عالی هستند. این ابرها استاندارد صنعت را تعیین میکنند و بهترین تجربه ممکن را برای مشتریان ارائه میدهند.
در حال حاضر، تنها یک ارائهدهنده ابر GPU وجود دارد که به رتبه ClusterMAX™ Platinum دست یافته است: CoreWeave. CoreWeave یک شبکه بسیار قوی، پشته نرمافزار / API عالی، زمان کارکرد / پایداری بالا، پشتیبانی مشتری عالی، مقیاسپذیری خوب و قیمتگذاری رقابتی را ارائه میدهد.
CoreWeave همچنین در بهرهبرداری از خوشههای H100 در مقیاس بزرگ (بیش از ۱۰ هزار GPU) تجربه قابل توجهی دارد و این امر آنها را به گزینهای جذاب برای شرکتهایی تبدیل میکند که به دنبال آموزش مدلهای زبانی بزرگ (LLM) پیشرفته هستند.
ClusterMAX™ Gold
ClusterMAX™ Gold دومین رتبه برتر در سیستم رتبهبندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا میشود که در اکثر معیارها قوی هستند، اما ممکن است در یک یا دو زمینه دارای نقصهای جزئی باشند.
ارائهدهندگانی که رتبه ClusterMAX™ Gold را دریافت کردهاند عبارتند از Microsoft Azure، Oracle Cloud Infrastructure (OCI)، AWS، Nebius AI و Crusoe Energy. این ارائهدهندگان خدمات بسیار خوبی را ارائه میدهند، اما دارای برخی اشکالات جزئی هستند که آنها را از دستیابی به رتبه Platinum باز میدارد. به عنوان مثال، Azure به دلیل مشکلات زمان کارکرد/پایداریاش به Gold تنزل یافته است.
ClusterMAX™ Silver
ClusterMAX™ Silver سومین رتبه برتر در سیستم رتبهبندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا میشود که از نظر فنی شایسته هستند و معمولاً برای خوشههای بزرگ قابل اعتماد هستند، اما فاقد برخی از ویژگیها یا قابلیتهای پیشرفتهتر هستند. به طور کلی، شرکت های بزرگ GPU ها را در خوشه های بزرگ از ابرهای ClusterMAX™ Silver اجاره نمی کنند. ابرهای Silver، ابرهایی عالی برای اجاره GPU در مقیاس کوچکتر و همچنین راه اندازی هستند. رقبای ClusterMAX™ Silver عبارتند از Lambda، Fluidstack، Paperspace، VAST.AI و RunPod.
ClusterMAX™ Bronze
ClusterMAX™ Bronze چهارمین رتبه برتر در سیستم رتبهبندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا میشود که از نظر فنی شایسته هستند اما مشکلات عملکرد قابل توجهی دارند. به طور کلی، شرکت های بزرگ GPU ها را از ابرهای ClusterMAX™ Bronze اجاره نمی کنند. ClusterMAX™ Bronze در حال حاضر فقط شامل Google Cloud است. ابرهای برنزی، ابرهایی عالی برای نمونهسازی اولیه، یا کارهای کوچک هستند. این بدان دلیل است که آنها ممکن است برای خوشههای بزرگ یا مدلهای پیشرفته GPU ناپایدار باشند.
با این حال، ما فکر میکنیم Google Cloud در حال تلاش جدی برای انتقال به سطوح بالاتر است. ما معتقدیم Google Cloud در زمان ارزیابی مجدد بعدی ما در مسیر سریعی به سمت ClusterMAX™ Gold یا ClusterMAX™ Platinum قرار دارد.
ClusterMAX™ UnderPerform
ClusterMAX™ Underperform پایین ترین رتبه در سیستم رتبه بندی ClusterMAX™ است. این رتبه به ابرهای GPU اعطا میشود که مشکلات عملکرد قابل توجهی دارند و توصیه نمیشود. به طور کلی، شرکت های بزرگ GPU ها را از ابرهای ClusterMAX™ Underperform اجاره نمی کنند. ابرهای عملکرد ضعیف، ابرهایی هستند که اجاره را در آنها توصیه نمی کنیم. در حال حاضر، ClusterMAX™ Underperform شامل Corellium، Vultr، Hetzner، Contabo، OVH، Scaleway و vast.ai است (ممکن است چند مورد برای VAST متفاوت باشد). به طور کلی، این ابرهای عملکرد ضعیف دارای زمان کارکرد یا قابلیت مقیاس پذیری پایینی هستند. ما به سادگی به هیچ کس توصیه نمی کنیم GPU ها را از این ابرهای عملکرد ضعیف اجاره کند.
Coreweave
Coreweave یک شرکت متخصص است که فقط برای رایانش با GPU ساخته شده است. این شرکت توسط بنیانگذاران بسیار فنی ساخته شده است که درک خوبی از آنچه مشتریان با GPU به آن اهمیت میدهند، دارند. Coreweave در زمینه رایانش با GPU تخصص دارد، به این معنی که به جای تلاش برای ارائه طیف گستردهای از خدمات، میتواند تمام تلاش خود را بر ارائه بهترین تجربه ممکن برای مشتریان خود متمرکز کند.
برخی ممکن است بحث کنند که چگونه Coreweave توانسته است بسیاری از این مزیتها را کسب کند، که بسیاری از آنها به توانایی ادغام مزیت رقابتی اصلی در سراسر اکوسیستم و روابط مرتبط با آن مرتبط است. این امر از طریق موارد زیر به دست میآید:
- جمعآوری و نگهداری مستمر کارکنان با استعداد برای اجرای ابتکارات لازم.
- تطبیق منابع مالی در خط، و ارائه آن به هر فرصتی برای رشد.
- ادغام مزایای رقابتی اصلی در سراسر اکوسیستم، که به یک موتور ماندگار تبدیل میشود که از طریق آن مزایای جدید همیشه در حال توسعه هستند.
توانایی ادغام این موارد یک عنصر کلیدی برای Coreweave است که به آنها اجازه می دهد از سایر بازیگران به عنوان یک بازیگر خاص خارج شوند.
نئوکلاد و ابرمقیاسپذیرها: تفاوت
ابر مقیاسپذیرها شرکتهایی هستند که زیرساختهای رایانشی در مقیاس بزرگ ارائه میدهند. این شرکتها معمولاً طیف گستردهای از خدمات از جمله رایانش، ذخیرهسازی و شبکهسازی را ارائه میدهند. ابر مقیاسپذیرها معمولاً شرکتهای بزرگی هستند که منابع زیادی برای سرمایهگذاری در زیرساخت دارند. برخی از نمونهها عبارتند از Amazon Web Services (AWS)، Microsoft Azure و Google Cloud Platform (GCP).
نئوکلادها شرکتهای کوچکتری هستند که زیرساختهای رایانشی تخصصی ارائه میدهند. این شرکتها معمولاً بر روی یک نوع خاص از رایانش مانند رایانش با GPU یا رایانش با عملکرد بالا تمرکز دارند. نئوکلادها معمولاً شرکتهای چابکتری هستند که میتوانند به سرعت به تغییرات بازار پاسخ دهند.
قیمتگذاری: ابرمقیاسپذیر در مقابل نئوکلاد
قیمتگذاری اجاره GPU برای ابرمقیاسپذیرها و نئوکلادها بسته به عوامل مختلفی متفاوت است. چند عامل کلیدی که میتواند قیمت را تحت تأثیر قرار دهد عبارتند از نوع GPU، مدت زمان اجاره و میزان محاسبات مورد نیاز.
در حالت کلی، قیمتگذاری ابرمقیاسپذیرها برای اجاره GPU در مقایسه با نئوکلادها بالاتر است. این به این دلیل است که ابرمقیاسپذیرها معمولاً به بازار سازمانی خدمت میکنند که مایل به پرداخت هزینه بیشتر برای SLA، امنیت و انطباق بالاست. نئوکلادها اغلب گزینههای مقرون به صرفهتری را ارائه میدهند، اما ممکن است از نظر SLA، امنیت و انطباق قابلیت اطمینان کمتری داشته باشند.
قیمتگذاری اغلب بسته به نوع GPU نیز متفاوت است. جدیدترین و قدرتمندترین GPUها گرانترین اجاره هستند، در حالی که GPUهای قدیمیتر و کمقدرتتر معمولاً گزینههای مقرون به صرفهتری هستند. به عنوان مثال، اجاره یک Nvidia H100 گرانتر از یک Nvidia A100 خواهد بود.
علاوه بر این، قیمتها بر اساس مدت زمان اجاره متفاوت است. اجارههای کوتاهمدت معمولاً گرانتر از اجارههای بلندمدت هستند، زیرا ارائهدهندگان باید هزینه نگهداری و استهلاک سختافزار را جبران کنند.
بهروزرسانی قیمت 3/26/2025
در میان مقیاسپذیرها، Oracle با قیمت رقابتی عرضه میشود. به ویژه، Oracle Cloud دارای یکی از پایینترین قیمتهای اجاره GPU است. ما معتقدیم Oracle جدی است و به همین دلیل است که رتبه Gold را دریافت کرده است.
وضعیت فعلی تقاضا: DeepSeek تثبیت و حتی افزایش قیمتها را باعث شد
راهاندازی DeepSeek باعث تثبیت کوتاهمدت و حتی افزایش قیمت اجاره H200 شد. اگر به خاطر داشته باشید، DeepSeek یک شرکت چینی است که یک مدل زبانی بزرگ (LLM) را راهاندازی کرد که رقبای خود را از نظر دقت در معیارها شکست داد. در نتیجه، تقاضا برای GPUهای محاسباتی بالارده برای آموزش این مدل زبانی بزرگ به طور ناگهانی افزایش یافت.
اما در میانمدت تا بلندمدت، قیمتها همچنان در حال کاهش هستند. این به این دلیل است که تعداد فزایندهای از GPUهای محاسباتی در دسترس قرار میگیرند. با این حال، هنوز تعداد کمی از شرکتها وجود دارند که در حال حاضر خوشههای 8K GPU یا 10K GPU را برای مقیاس مورد نیاز و مقرون به صرفه مستقر کردهاند.
وضعیت فعلی عرضه
همانطور که قبلاً اشاره کردیم، در حال حاضر بیش از 100 نئوکلاد به عنوان ارائهدهنده اجاره GPU در دسترس هستند. به طور کلی، بازار از عدم اطمینان بیش از حد رنج می برد. شرکت ها می ترسند خود را ملزم به خرید بلندمدت یا قراردادهای بلندمدت کنند، زیرا می دانند قیمت GPU محاسباتی در طول زمان کاهش می یابد. جنسن هوانگ، مدیر عامل انویدیا و به تعبیری "نابودگر ارشد درآمد"، هفته گذشته گفت: «وقتی Blackwellها به حجم انبوه شروع به عرضه کنند، حتی نمیتوانید Hopperها را رایگان بدهید.»
از دیدگاه اپراتور GPU، این باید هشداری برای ارائهدهندگان اجاره GPU باشد تا اطمینان حاصل کنند که قراردادهایی را منعقد میکنند که آنها را از کاهش سریع قیمت محاسبات محافظت میکند – یعنی تا حد امکان قراردادهای بلندمدت امضا کنند. از دیدگاه مشتری، آنها ممکن است انعطافپذیری در تعهدات خود را ترجیح دهند و قراردادهای کوتاهمدت را انتخاب کنند.
توصیه ها برای مشتریان
توصیه شماره 1 این است که قبل از خرید، خرید کنید. به یاد داشته باشید، بازار برای ارائهدهندگان اجاره GPU رقابتی است و به طور کلی به نفع مشتریان است. در حال حاضر 100 ابر GPU با عمدتاً همان مشتریان در رقابت هستند. به طور کلی، در حال حاضر، ما معتقدیم که بهتر است انعطافپذیری در تعهدات خود داشته باشید و به قراردادهای کوتاهمدت پایبند باشید تا از کاهش قیمت اجاره GPU جلوگیری شود. توصیه شماره 2 این است که هر بار یک دسته کامل را با یک شرکت به صورت آزمایشی اجاره نکنید. هر کدام را امتحان کنید تا بفهمید کدامیک برای شما بهتر عمل می کند.
نکته دیگری که در نظر گرفته می شود، به ویژه اگر نیاز دارید حجم زیادی از GPU ها را مدیریت کنید، انتخاب ClusterMAX™ Platinum و Gold است. نکته دیگر این است که ما در این مقاله به قیمت دسترسی نداریم، با این حال، در بین نئوکلادهایی که بسیار خوب هستند، Nebius کمترین قیمت و بهترین شرایط را دارد. اگر میخواهید با یک ابر در اندازه و مقیاس کوچکتر با ارائهدهنده اصلی ابرمقیاسپذیر همراه شوید، میتوانید با Crusoe بروید. ارائهدهندگان بسیار بزرگی مانند Amazon Web Services AWS، Google Cloud و Microsoft Azure در حال حاضر، کمترین عملکرد را برای مبلغ درخواستی خود در این مرحله ارائه میدهند، در حالی که خدمات مناسبی ارائه میدهند.
آینده این بخش و Coreweave
بر اساس مدل سازی های گذشته ما از این بخش، که در گزارش اقتصاد ابر GPU منتشر شد، می توانیم تأیید کنیم که بر اساس عملکرد فعلی، این بخش و Coreweave شایسته در نظر گرفته شدن به عنوان یک سرمایه گذاری بسیار قوی هستند. با این حال، برای ادامه این روند، آنها باید به ایجاد مزیت رقابتی اصلی که به درستی ایجاد شده است ادامه دهند. این نه تنها باید ادامه یابد، بلکه باید برای ادغام کامل در سراسر اکوسیستم مرتبط با آن استفاده شود.
در حالی که ارزش بخش و عملکرد Coreweave بر اساس داده های گذشته امیدوارکننده است، این تنها به شرطی ادامه خواهد یافت که تیم بهینه سازی های لازم را در کل بخش انجام دهد. این به معنای ادامه ساخت، نگهداری، تکرار و افزایش مقیاس کل این بخش است. به طور کلی، باید رویکرد فعلی و تعهد برای انطباق را اتخاذ کرد. به یاد داشته باشید، نوآوری و بهینه سازی در انحصار هیچ کس نیست.
نحوه ارزیابی یک GPU اجارهای – هزینه کل مالکیت، IRR و تجزیه و تحلیل سناریو
حالا می خواهیم کمی ریاضیات برای مدل اقتصادی خوشه GPU اجاره کنیم. تکرار می کنیم که برای راحتی همه چیز را بیش از حد ساده کرده ایم.
به طور کلی، ما به سه جزء اصلی نگاه میکنیم:
- هزینه اولیه سرمایه، اجاره ماهیانه سرور و هزینه برق
- هزینه تمام شده، اجاره، هزینه نیروی کار، هزینه عملیات و نگهداری
- درآمد، بهرهوری و تداوم
به طور کلی، ما به نرخ بازده داخلی (IRR) هدف 15٪ یا بیشتر نگاه می کنیم. برخی از معیارها و فرضیاتی که مورد بررسی قرار می گیرند در زیر شرح داده شده است:
- متوسط قیمت فروش سرور، 50000 دلار
- هزینه برق با 7 سنت در هر کیلووات ساعت
- نرخ استهلاک، 5 سال
- زمان اجاره، هر سرور 24/7
- حاشیه عملیاتی 15 درصدی برای هر سرور
یک تحلیل خوب و سریع به این صورت است:
- درآمد با 2075 دلار در ماه
- هزینه برق در هر ماه با 300 دلار
- نرخ بازده داخلی، 17.4 درصد
در حالی که اینها نتایج امیدوارکننده ای هستند، می بینیم که نرخ های اجاره سرور بالاتر از 2500 دلار در ماه هستند. برای بررسی بیشتر موضوع قیمتها، ادامه مطلب را بخوانید.
نرخ اجاره بازار فعلی برای H100
وضعیت فعلی برای GPU های H100 80 گیگابایتی با NVLink در هر GPU در هر ساعت تقریباً به شرح زیر است:
- حداقل یک سال اجاره، تقریباً 2.3 دلار
- حداقل سه ماه اجاره، تقریباً 2.70 دلار
- حداقل یک ماه اجاره، تقریباً 3.10 دلار
- بدون تعهد، تقریباً 3.50 دلار
این منجر به هزینه موثر ماهانه تقریباً میشود
- حداقل یک سال اجاره، تقریبا 1700 دلار
- حداقل سه ماه اجاره، تقریباً 2000 دلار
- حداقل یک ماه اجاره، تقریباً 2300 دلار
- بدون تعهد، تقریباً 2600 دلار
همانطور که می بینیم، کاهش قیمت به نفع مشتری است که به طور کلی مایل به ارائه تعهد و پرداخت زودهنگام است. ما معتقدیم با گذشت زمان این قیمتها کم می شوند. اینها برخی از جزئیات در مورد نرخ بازده داخلی و چشم انداز کلی اقتصادی اجاره سرور است.